



19 BUNDESREPUBLIK  
DEUTSCHLAND



DEUTSCHES

PATENT- UND  
MARKENAMT

12 Übersetzung der  
europäischen Patentschrift  
87 EP 0634 030 B 1  
10 DE 693 20 180 T 2

51 Int. Cl. 6:  
G 06 F 1/32

1)

DE 693 20 180 T 2

21 Deutsches Aktenzeichen: 693 20 180.0  
86 PCT-Aktenzeichen: PCT/JP93/00418  
86 Europäisches Aktenzeichen: 93 906 871.4  
87 PCT-Veröffentlichungs-Nr.: WO 93/20498  
86 PCT-Anmeldetag: 30. 3. 93  
87 Veröffentlichungstag der PCT-Anmeldung: 14. 10. 93  
87 Erstveröffentlichung durch das EPA: 18. 1. 95  
87 Veröffentlichungstag der Patenterteilung beim EPA: 5. 8. 98  
47 Veröffentlichungstag im Patentblatt: 10. 12. 98

|                                                                                                       |                                                            |
|-------------------------------------------------------------------------------------------------------|------------------------------------------------------------|
| (30) Unionspriorität:<br>860717 31. 03. 92 US                                                         | (72) Erfinder:<br>LIN, Chong-Ming, Sunnyvale, CA 94087, US |
| (73) Patentinhaber:<br>Seiko Epson Corp., Tokio/Tokyo, JP                                             |                                                            |
| (74) Vertreter:<br>Grünecker, Kinkeldey, Stockmair & Schwahnhäuser,<br>Anwaltssozietät, 80538 München |                                                            |
| (84) Benannte Vertragstaaten:<br>DE, FR, GB                                                           |                                                            |
| (54) SELEKTIVER ABSCHALTBEtrieB FÜR EIN HOCHLEISTUNGS-CPU-SYSTEM.                                     |                                                            |

Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen das erteilte europäische Patent Einspruch einlegen. Der Einspruch ist schriftlich einzureichen und zu begründen. Er gilt erst als eingelebt, wenn die Einspruchsgebühr entrichtet worden ist (Art. 99 (1) Europäisches Patentübereinkommen).

Die Übersetzung ist gemäß Artikel II § 3 Abs. 1 IntPatÜG 1991 vom Patentinhaber eingereicht worden. Sie wurde vom Deutschen Patentamt inhaltlich nicht geprüft.

DE 693 20 180 T 2

07.07.98

EP 93 906 871.4

SEIKO EPSON CORPORATION

Die vorliegende Erfindung betrifft allgemein Systeme und Verfahren, um die Energierabführungsanforderungen und die von einzelnen, mikroelektronischen Einrichtungen verbrauchte Energie zu verringern, und insbesondere dynamisch den Energieverbrauch solcher mikroelektronischer Einrichtungen und die sich ergebende, verlangte Energieabführung zu steuern.

Energieabführungsanforderungen von mikroelektronischen Einrichtungen (auch Halbleitereinrichtungen oder Halbleiterchips oder integrierte Schaltungen genannt) sind bei ihrer Konstruktion, Herstellung, Verwendung kritisch geworden. Dies gilt insbesondere für größtintegrierte Einrichtungen und ultragroß integrierte Einrichtungen, die typischerweise heutzutage über 1.000.000 Transistoren (aktiv, passiv) auf einem einzelnen Halbleiterchip aufweisen. Die aktiven Einrichtungen werden typischerweise bei sehr hoher Geschwindigkeit betrieben (getaktet) (wobei Geschwindigkeiten von 25 MHz und 33 MHz heute typisch sind, wobei viel höhere Taktraten überlegt werden, z.B. 250 MHz), um die erwünschte Funktion und Leistung des Systems zu erreichen.

Wie es gut bekannt ist, erzeugen die große Taktrate und die große Anzahl aktiver Einrichtungen, unabhängig von der Herstellungstechnologie, die verwendet wird, bedeutende Energieabführungsanforderungen, verglichen mit der tatsächlichen physikalischen Größe des Chips der mikroelektronischen Einrichtung. Für Erläuterungszwecke, ein typischer Chip wird mit 1.000.000 aktiven Einrichtungen auf einem Chip von 15 mm mal 15 mm hergestellt und verlangt mehr als 132 Ausführungsstifte. Eine solche mikroelektronische Einrichtung kann mit einer Systemtaktgeschwindigkeit von 30 MHz bei einer CMOS Technologie (komplementäre Metalloxidhalbleitertechnologie) von 1 Mikrometer ( $\mu\text{m}$ ) arbeiten.

Der Chip muß dauerhaft in einem geeigneten Gehäuse oder Umhüllung untergebracht sein, die unter anderen Dingen (Herausführungsstifte, umgebungsmäßiger, physikalischer Schutz usw.) eine angemessene Wärmeableitung bereitstellen muß, um ein Versagen der Einrichtung zu verhindern.

Für eine einzelnen, mikroelektronische Einrichtung, wie das obige Beispiel, ist es nicht unüblich, im Bereich von 5-10 Watt an Wärme zu erzeugen, die während des normalen Betriebs abgeführt werden muß. Als ein Ergebnis kann die Verbindungstemperatur des Chips einer solchen mikroelektronischen Einrichtung 100°C bei einem keramischen Gehäuse ohne Wärmesenke an dem oberen Ende des handelsüblichen Temperaturbereiches von 70° Umgebung erreichen. Die Zahl 5-10 Watt erscheint klein verglichen mit der Ableitungsanforderung aufeinanderfolgender Generationen leistungsstärkerer, mikroelektronischer Einrichtungen, die für das Jahr 2000 vorgesehen sind und 100 Millionen aktive Einrichtungen auf einem einzigen Chip besitzen. Die überlegten Chipgrößen sind 25 mm mal 25 mm.

Verschiedene Strategien für die Umhüllung sind entwickelt worden, um mit der großen Wärmeableitung zurechtzukommen. Alle schließen irgendeine Art Wärmesenke oder Wärmeschmiermittelanordnung ein, um schnell unerwünschte Wärme abzuziehen, damit die mikroelektronische Einrichtung (Chip und Verbindungsdrähte) gegenüber physikalischem Versagen und Leistungsverschlechterung geschützt werden. Gas, wie Luft, und sogar Flüssigkeit, wie Wasser, Freon und wirksamere Kühlmittel werden typischerweise zusätzlich zu einer herkömmlichen Wärmesenke verwendet. Die Wärmesenkenmaßnahmen jedoch wirken, die physikalische Größe, die Kosten, die mechanische Komplexität und das Gewicht der umhüllten, mikroelektronischen Einrichtung zu erhöhen. Des weiteren wirken die Anforderungen an die Wärmeableitung (d.h., Wärmestrahlung), die physikalische Größe eines Chips zu begrenzen, der in einem einzelnen Gehäuse aufgenommen werden kann.

Beispielhaft für Wärmeableitungsanforderungen sind herkömmliche Mikroprozessorchips, die bei Taktgeschwindigkeiten von bis zu 50 MHz laufen und typischerweise 5 Watt abgeleitete Energie beim normalen Betrieb erzeugen können. Um die Wärmeablei-

tungsanforderung zu erfüllen, sind besondere Anordnungen von Wärmesenken vorgesehen.

Das konstante Bestreben bei der Elektronik ist, die Größe mikroelektronischer Einrichtungen zu verringern, so daß kleinere und leichtere, elektronische Erzeugnisse und Computer hergestellt werden können. Diese Miniaturisierungsbestrebung fährt unbegrenzt fort und erzeugt historisch von Jahr zu Jahr dramatische Verringerung der physikalischen Größe.

Die Wärmeableitungsanforderung jedoch wirkt als Hindernis bei diesem Miniaturisierungsvorgang der elektronischen und Computereinrichtungen. Mit anderen Worten begrenzt die Physik, Wärme von der mikroelektronischen Einrichtung ableiten zu müssen, die physikalische Größe und die Gewichtsverringerung der elektronischen oder Computereinrichtung, die erreicht werden kann. Dies beeinträchtigt auch die Lebensdauer mikroelektronischer Einrichtungen. Beispielsweise ist der Grund, warum ein Festkörperlasер eine kürzere Lebensdauer als eine Leuchtdiode aufweist, wegen der Wärmekonzentration auf einen kleinen Bereich.

Eine sich merklich fortsetzende Bestrebung in der Elektronik ist die Zunahme von Eigenschaften und Funktionen und die Abnahme der Reaktionszeit, die von einer elektronischen oder Computereinrichtung geliefert werden können. Dies wird durch kompliziertere und leistungsstärkere, mikroelektronische Einrichtungen erzielt. Dies ist das Ergebnis zunehmender Integration aktiver Einrichtungen auf einem einzigen Chip. Jedoch ergeben zusätzliche, aktive Einrichtungen auf dem Chip erhöhte Wärmeableitungsanforderungen, die wirken, die Größenverringerung bei der Größe des Gehäuses der mikroelektronischen Einrichtung zu begrenzen, die erreicht werden kann. Selbst wenn die Versorgungsspannung verringert wird, gibt ein DEC's Alpha CMOS Chip beispielsweise 30 Watt bei 200 MHz ab, wie berichtet wird.

Die dramatische Abnahme der physikalischen Größe von mikroelektronischen Einrichtungen verglichen mit ihrer Rechenfähigkeit und Merkmalen und Funktionen, die sie erzeugen können, hat die Erzeugung sehr kleiner Personalcomputer ergeben, die typischerweise Laptop-, Notebook- und Palmtop-Computer genannt werden. Dies ist der

letzte Festpunkt bei einer weitergehenden Tendenz, Computer mit leistungsstarken Merkmalen und Funktionen in der Größe zu verringern.

Ein typischer, tragbarer, heutiger Computer mit einem Mikroprozessor vom Typ 386SX besitzt physikalische Abmessungen von 30 cm (12 Inch) mal 40 cm (16 Inch) und ein Gewicht von 7 Kg (15 Pfund), von dem 0,5 Kg (1 Pfund) die aufladbare Batterie ist. Ein typischer, heutiger Laptop-Computer mit einem Mikroprozessor vom Typ 386SXL besitzt physikalische Abmessungen von 20 cm (8 Inch) mal 28 cm (11 Inch) mal 5 cm (2 Inch) und ein Gewicht von 2-3 Kg (5-7 Pfund), von denen 0,2 Kg (0,5 Pfund) die wiederaufladbare Batterie ist.

Einer der kritischsten Begrenzungsfaktoren bei solchen Notebook- (auch Laptop- und Palmtop-) Computern ist jedoch die Batterie, die benötigt wird, damit die Maschine läuft. Die Batterie muß eine ausreichende, elektrische Leistung liefern, so daß der Computer während einer ausreichend langen Zeitdauer arbeiten kann, um den Anforderungen eines Benutzers zu genügen. Eine typische Betriebszeit für Notebook-Computer ist heutzutage im Bereich von 3 bis 4 Stunden für eine einzige Batterieaufladung.

Die Batterie umfaßt einen der größten Bauteile des Computersystems im Hinblick auf das Gewicht und die physikalische Größe. Jedoch ist es für den Benutzer kritisch, daß eine ausreichende, elektrische Leistung durch die Batterie bereitgestellt wird, damit daß der erwünschte Computerbetrieb während einer ausreichenden Zeitdauer vorliegen kann. Jedoch bewirkt diese Betriebsanforderung, daß die Gesamtgröße des Computersystems zunimmt, da die physikalische Größe der Batterie erhöht werden muß, um diese Anforderungen zu erfüllen.

Infolgedessen wird eine beträchtliche Forschung und Entwicklung darauf gerichtet, wirksamere Batterien bei gegebener Größe und Gewicht zu erzeugen. Das Ziel ist hier, die Batterietechnologie bezüglich der Ladungskapazität zu erhöhen, so daß die sich ergebende Batterie bei gegebener Größe und Raum mehr Leistung und eine längere Dauer liefert. Dies wiederum wirkt, die Größe des Computersystems zu verringern, das sie verwendet.

Zusätzlich dazu, die Batteriegröße zu verringern, ist beträchtlicher Aufwand darauf ausgedehnt worden, zu versuchen, die Leistung des Computersystems in Größen des Energieverbrauchs zu erhöhen. Eine herkömmliche Methode, wie sie von Intel verwendet wird, ist, die nichtverwendeten Peripheriechips auszuschalten. Dies tritt bei der Intel 80836 Chipeinheit auf. Indem nichtbenutzte Peripheriechips ausgeschaltet werden, kann eine bedeutende Batterielebensdauer erreicht werden, weil die Peripheriechips beträchtliche Mengen an Energie verbrauchten.

Eine weitere Methode, die in dem AM386DXL Mikroprozessorchip von AMD ausgeführt ist, ist, die Taktgeschwindigkeit (z.B. von 40-0 MHz) zu verlangsamen, um Energie zu sparen.

Im Hinblick auf das Obige besteht ein großes Bedürfnis zur Verbesserung der Wärmeableitung und des Energieverbrauchs durch mikroelektronische Einrichtungen, insbesondere bei den mit Computersystemen verwendeten, um die Komplexität und Größe bei der Unterbringung in Baugruppen zu verringern und die Funktionsfähigkeitszeit von Systemen zu erhöhen, wo Batterien verwendet werden, elektronisch die mikroelektronischen Einrichtungen zu versorgen.

JP-A-63026716 offenbart eine Einrichtung, um den Stromverbrauch einer CPU zu verringern, indem wahlweise Takte an die Funktionseinheiten der CPU ausgegeben werden. Eine Taktverteilungsschaltung erhält ein Steuersignal von einer Befehlsdecodierschaltung und führt Takte den Funktionseinheiten zu, die für den Befehl benötigt werden.

Aus der DE-A-40 40 382 ist eine integrierte Halbleitereinrichtung, die wenigstens einen Funktionsblock aufweist, bekannt. Der Block wird im voraus einer Operation aktiviert und nach Abschluß einer Operation inaktiviert, um dadurch den Stromverbrauch zu verringern. Ein Steuersignal zur Steuerung der Aktivierung und Inaktivierung des Blocks wird nach Maßgabe eines decodierten Befehls erzeugt.

Die Zielsetzung der vorliegenden Erfindung ist, ein System und ein Verfahren für eine mikroelektronische Einrichtung zu schaffen, die den Stromverbrauch in hohem Maß verringern können.

Diese Zielsetzung wird durch ein System gelöst, das die Merkmale des Anspruchs 1 aufweist, und durch ein Verfahren, das die Schritte umfaßt, wie sie im Anspruch 5 genannt sind. Bevorzugte Ausführungsformen sind Gegenstand verschiedener abhängiger Ansprüche.

Eine mikroelektronische Einrichtung gemäß der vorliegenden Erfindung ist aus zwei oder mehr Funktionseinheiten aufgebaut, die alle auf einem einzigen Chip oder Wafer angeordnet sind. Die vorliegende Erfindung arbeitet nach der Strategie, daß alle Funktionseinheiten auf dem Chip zu einer gegebenen Zeit bei der Ausführung eines Computerprogramms nicht betriebsbereit sind oder es sein müssen, das die mikroelektronische Einrichtung steuert. Die vorliegende Erfindung schaltet deshalb auf einer sehr schnellen Grundlage (typischerweise ein halber Taktzyklus) die Funktionseinheiten der mikroelektronischen Einrichtung gemäß den Anforderungen des Programms ein und aus, das ausgeführt wird. Die Arbeitsweise der vorliegenden Erfindung ergibt eine sehr bedeutende Verringerung des Stromverbrauchs und der entsprechenden Wärmeabstrahlung durch die mikroelektronische Einrichtung verglichen mit der herkömmlichen Methode, alle Funktionseinheiten die gesamte Zeit betriebsbereit zu halten.

Ein repräsentatives Beispiel der vorliegenden Erfindung, das hier beschrieben ist, hat eine Verringerung der Energieabstrahlung und des Stromverbrauchs von 30% verglichen mit der normalen, herkömmlichen Methode erreicht, alle funktionalen Betriebseinheiten während der gesamten Zeit während der Ausführung des Computerprogramms aktiv zu halten. In Abhängigkeit von der Architektur der mikroelektronischen Einrichtung und des Computerprogramms, das ausgeführt wird, können Verringerungen von 0% bis 50% erreicht werden. Bei einem einzelnen Skalarprozessor wäre eine CPU auf der niedrigeren Seite im Vergleich zu einer CPU mit Superskalararchitektur, weil mehr Blöcke häufiger unbenutzt bleiben.

Wenn die Funktionseinheiten in noch kleinere Blöcke unterteilt werden, dann kann ein größerer Prozentsatz an Einheiten/Blöcken ausgeschaltet werden, vorausgesetzt, daß die notwendige Steuerlogik, die notwendig ist, das Schalten auszuführen, nicht zuviel Verwaltung hinzufügt.

Die von der vorliegenden Erfindung zur Bestimmung verwendete Methode, wann Funktionseinheiten ein- und ausgeschaltet werden sollen, ist diejenige, die unter Verwendung einer Logikeinheit auf dem Chip ausgeführt wird, der die Ausführung und den Betrieb der Funktionseinheiten bestimmt (überwacht). Diese Überwachungsfunktion erzeugt Angaben über eine sich nähernde Operation (einschließlich Ausführung und Wartezeit, den erzeugten Befehl abzuschließen), die verwendet werden können, den Einschalt/Ausschalt-Betrieb der vorliegenden Erfindung zu steuern. Bei einer kompakten, preis-günstigen FPU auf einem Chip können z.B. nicht alle Einheiten gleichzeitig verwendet werden, oder eine Kollision kann sich ergeben. Wenn eine FALU Operation ausgeführt wird, mag der Multiplikations- oder die Divisionseinrichtung nicht gestattet sein, zu laufen. Der Strom zu diesen Einheiten kann deshalb abgeschaltet werden.

Irgendeine geeignete, vorbestimmte Zeitdauer kann von der vorliegenden Erfindung verwendet werden, um die Funktionseinheiten gemäß den Anforderungen des Computerprogramms ein- und auszuschalten, das ausgeführt wird. Das Einschalten/Ausschalten kann so schnell wie ein halber Taktzyklus sein, wenn es erwünscht ist, damit eine maximale Energieabstrahlungseinsparung und Stromverbrauchsverringerung erzeugt werden. Andere Taktzyklusperioden zum Einschalten und Ausschalten können verwendet werden.

Die vorliegende Erfindung sieht jede geeignete, elektronische Methode vor, um eine Funktionseinheit ein- und auszuschalten. Bei komplementären Metalloxidhalbleiterschaltungen (CMOS) ist die bevorzugte Methode, das Taktsignal zu der Funktionseinheit anzuhalten, die ausgeschaltet wird. Die Funktionseinheit kann nachfolgend durch die entgegengesetzte Methode eingeschaltet werden, die zum Ausschalten verwendet wird.

Die vorliegende Erfindung weist eine besondere Anwendbarkeit bei einer CMOS Schaltungsanordnung auf, weil sie den Vorteil der CMOS Eigenschaft vollständig nutzt, daß von einer Schaltung kein Strom verbraucht wird, es sei denn, es liegt eine Zustandsänderung vor. Indem Zustandsänderungen in der Funktionseinheit(en) verhindert werden, die an dieser Stelle der Ausführung des Computerprogramms nicht verwendet werden, kann die vorliegende Erfindung die erwünschte Verringerung der Energieabstrahlungsanforderung und der Stromverbrauchsverringerung erzeugen. Die Strombusse ein/aus-

zuschalten, ist nicht notwendig, und eine minimale Chipfläche wird zur Steuerung verlangt.

Die vorliegende Erfindung wird besser unter Bezugnahme auf die folgenden Zeichnungen verstanden, wenn sie in Verbindung mit dem beigefügten Text betrachtet werden.

Fig. 1 ist ein Blockdiagramm eines Grundplans auf einer hohen Ebene, das die Funktionseinheiten einer mikroelektronischen Einrichtung 100, die auf einem einzigen Chip 102 hergestellt ist, gemäß der vorliegenden Erfindung zeigt.

Fig. 2 ist ein Ablaufdiagramm auf einer hohen Ebene, das die Arbeitsschritte auf einer hohen Ebene der vorliegenden Erfindung zeigt.

Fig. 3 ist eine Darstellung von vier Spuren, die eine repräsentative Arbeitsweise einer Funktionseinheit gemäß der vorliegenden Erfindung zeigt;

Fig. 4 ist ein Blockdiagramm einer Ausführungsform der vorliegenden Erfindung, um die Funktionseinheiten ein- und auszuschalten, wobei das Systemtaktsignal mit einem gesteuerten Steuersignal verwendet wird.

Fig. 5 ist ein Blockdiagramm, um die Funktionseinheiten ein- und auszuschalten, indem der Zustand der Eingänge zu den Funktionseinheiten gesteuert wird.

Fig. 6 ist ein Blockdiagramm einer Ausführungsform der vorliegenden Erfindung, wo die Überwachungsinformation 402 von einem Compilierer in Verbindung mit dem Compilieren von jedem Maschinencodebefehl erzeugt wird.

Fig. 7 ist ein Blockdiagramm, wo die Überwachungsinformation 402 durch die Befehlsdecodiereinheit und die Befehlsausführeinheit, die mit den Maschinencodebefehlen arbeiten, erzeugt wird.

Fig. 8 ist ein Blockdiagramm der Ausführungsform der vorliegenden Erfindung eines optimierenden Compilierers, der zur Umordnung der Maschinencodebefehle verwendet wird, damit eine maximale Energieeinsparung gemäß der vorliegenden Erfindung erzielt wird.

Fig. 9 ist ein Blockdiagramm auf hoher Ebene eines Grundplans, das eine beispielhafte mikroelektronische Einrichtung 100 zeigt, die bei dem Beispiel der vorliegenden Erfindung verwendet wird.

Fig. 10 zeigt ein Blockdiagramm eines Energieoptimierungsschemas, wie es bei einem Laptop- oder Palmtop-Computer gemäß der vorliegenden Erfindung angewendet wird.

Die vorliegende Erfindung ist ein System und ein Verfahren zur wahlweisen Steuerung der jeder der Funktionseinheiten der mikroelektronischen Einrichtung gelieferten Energie, so daß die Funktionseinheiten ein- und ausgeschaltet werden können, wie sie bei der Ausführung des Computerprogramms benötigt werden, das die mikroelektronische Einrichtung steuert. Das dynamische Einschalten und Ausschalten der Funktionseinheiten gemäß den Anforderungen des Programmschritts/Programmschritte, die ausgeführt werden, bewirkt eine beträchtliche Verringerung der Energie (z.B. 10-30%), die von den Funktionseinheiten verbraucht wird, was eine merkliche Verringerung der Wärmeabstrahlungsanforderungen und eine merkliche Verringerung der Energieanforderungen der mikroelektronischen Einrichtung ergibt. Die vorliegende Erfindung ergibt eine bedeutende Verringerung bei den Wärmeabstrahlungsanforderungen und bei den Energieanforderungen für die mikroelektronische Einrichtung, was bedeutet, daß die Anforderungen an Wärmesenken verringert werden und die Batterieentladungszykluslänge ausgedehnt wird, was beides ein sehr erwünschtes Ergebnis ist. Des weiteren können die Strombusleitungsweiten verringert werden. Dies führt zu einer wesentlichen Flächeneinsparung für Chips mit Größtintegration.

Fig. 1 zeigt den Grundriß einer beispielhaften, mikroelektronischen Einrichtung gemäß der vorliegenden Erfindung. Wie es gezeigt ist, weist die mikroelektronische Einrichtung, die allgemein mit dem Bezugszeichen 100 angegeben ist, einen Chip 102 auf, der z.B. aus Silicium hergestellt ist und auf dem verschiedene Funktionseinheiten ausgeführt

sind, die die Architektur der elektronischen Schaltung bilden, die auf dem Chip 102 hergestellt ist. Wie es gezeigt ist, schließen diese Funktionseinheiten des repräsentativen Beispiels ein: eine Systemtakteinheit 104, eine zentrale Verarbeitungseinheit (CPU) 106, eine Cache-Steuereinheit (CCU) 108, eine Gleitkomma-Einheit (FPU) 110, eine ganzzählige Einheit (INT) 112 und eine Speichersteuereinheit (MCU) 114. Es versteht sich, daß die Funktionseinheiten, die in Fig. 1 gezeigt sind, lediglich dem Zweck der Darstellung dienen. Die vorliegende Erfindung zieht irgendeine Anordnung von Funktionseinheiten auf dem Chip 102 der mikroelektronischen Einrichtung 100 in Betracht. Beispielsweise könnte die mikroelektronische Einrichtung 100 einen Speicher sowie logische Funktionseinheiten einschließen. Die vorliegende Erfindung zieht gegenwärtige und zukünftige Computerarchitekturen in Betracht, wie sie auf einem einzigen Halbleiterchip oder Substrat ausgeführt werden.

Wie es in Fig. 1 gezeigt ist, ist eine Logikeinheit 116 Teil der mikroelektronischen Einrichtung 100. Die Logikeinheit 116 arbeitet, wie es mehr im einzelnen unten erörtert ist, mit dem Systemtakt 104, um zu bestimmen, wann ein- und auszuschalten ist, und tatsächlich die Versorgung der Taktsignale zu den Funktionseinheiten gemäß einer Ausführungsform der vorliegenden Erfindung ein- und auszuschalten.

Fig. 2 zeigt ein Ablaufdiagramm auf hoher Ebene, das die Arbeitsweise auf hoher Ebene des Systems und des Verfahrens der vorliegenden Erfindung darstellt. Nun auf Fig. 2 bezugnehmend verwendet die vorliegende Erfindung vier grundsätzliche Arbeitsschritte.

Erstens, die vorliegende Erfindung decodiert (oder bestimmt sonstwie) die Maschinencodebefehle (von dem Quellencode compilerte) des Computerprogramms, das auf der mikroelektronischen Einrichtung 100 läuft (sie steuert). Bei dem ersten Schritt überwacht die vorliegende Erfindung den Maschinencode, um zu bestimmen, welche bestimmte Funktionseinheit(en) als nächstes benötigt wird, den nächsten Befehl auszuführen, der zur Ausführung ausgegeben wird. Eine vorbestimmte Taktzyklusgröße (der Einfachheit halber CCA genannt), bevor eine Funktionseinheit(en) benötigt wird, den nächsten Maschinenbefehl auszuführen, der ausgegeben wird, wird als Zeitrahmen verwendet, den die vorliegende Erfindung verwendet, um nach den nächsten Maschinencodebefehlen zu sehen, bevor sie ausgegeben werden, ausgeführt zu werden. Diese Taktzyklusgröße CCA erlaubt der vorliegenden Erfindung, die geeigneten, logischen Schritte auszuführen.

ren, damit die Funktionseinheit(en) rechtzeitig eingeschaltet wird, so daß der ausgegebene Maschinencodebefehl der Reihe nach ausgeführt werden kann. Dieser erste Schritt oder Block ist mit einem Bezugszeichen 202 angegeben.

Bei einem Schritt oder Block 204 entfernt die vorliegende Erfindung die Schalt-Sperrsteuerungssignale von der Funktionseinheit eine vorbestimmten Taktzyklusperiode (nur der Einfachheit halber Takteinschaltung CKPWRUP genannt) bevor die Funktionseinheit bereit sein muß, um den ausgegebenen Maschinencodebefehl auszuführen. Die Schaltfähigkeit wird während der Taktfreischaltung CKPWRUP bereitgestellt, so daß die Funktionseinheit voll betriebsbereit ist, wenn der betreffende Maschinencodebefehl an die Funktionseinheit ausgegeben wird. Somit kann man bei diesem zweiten Schritt sehen, daß die vorliegende Erfindung die betreffende Funktionseinheit(en) ausreichend früher aktiviert, als dann, wenn sie benötigt wird, den Maschinencodebefehl auszuführen, so daß die Funktionseinheit(en) voll betriebsbereit ist, wenn die Ausführung stattfinden muß.

Irgendeine Größe an Taktzyklen kann für die Taktfreischaltung CKPWRUP ausgewählt werden. Bei einer bevorzugten Ausführungsform der vorliegenden Erfindung wird ein einzelner, halber Taktzyklus verwendet. Mit anderen Worten, die Funktionseinheit wird innerhalb eines einzigen, halben Taktzyklus aktiviert, bevor sie zur Ausführung eines ausgegebenen Maschinencodebefehls benötigt wird. Man kann somit erkennen, daß die Funktionseinheit aus oder in einem "Bereitschafts"-Modus bleibt (der den Zustand ohne Eingang beschreibt, der keinen Stromverbrauch bewirkt) bis zu dem allerletzten Moment bleibt, bevor sie zur Ausführung des Maschinencodebefehls benötigt wird.

Bei einem dritten Schritt oder Block 206 fährt die vorliegende Erfindung fort, der Funktionseinheit während einer vorbestimmten Taktzyklusperiode (der Einfachheit halber Takteinschaltung CKPWRON genannt) eine Schaltmöglichkeit bereitzustellen. CKPWRON ist die Zeitdauer (Anzahl der Taktzyklen), die von der Funktionseinheit verlangt wird, den ausgegebenen Maschinencodebefehl auszuführen. Als solche schließt sie die Taktzyklen ein, die benötigt werden, den ausgegebenen Befehl zu erhalten, und die Taktzyklen, die gleich der Warteperiode der Funktionseinheit sind, die Ausführung des Befehls abzuschließen.

Der vierte und letzte Schritt oder Block der vorliegenden Erfindung ist durch ein Bezugssymbol 208 wiedergegeben. Bei diesem vierten Schritt wird die Schaltmöglichkeit der Funktionseinheit nicht länger nach einer vorbestimmten Taktzyklusperiode (Taktausschaltung CKPWRDN) bereitgestellt, nachdem die Funktionseinheit die verlangte Aufgabe abgeschlossen hat, den Maschinencodebefehl des Computerprogramms auszuführen. Mit anderen Worten wird die Funktionseinheit abgeschaltet (inaktiviert) nachdem sie die verlangte Aufgabe ausgeführt hat. Auf diese Weise wird die Funktionseinheit nicht eingeschaltet oder aktiv beibehalten, nachdem sie nicht länger benötigt wird. Ein typischer Wert für CKPWRDN ist ein einzelner halber Taktzyklus. Diese Ausführungsform mit Aktivierung/Inaktivierung ist für Funktionseinheiten geeignet, die Speicher, Zustandsbewahrung oder Ähnliches verlangen. Andere Techniken liegen auch innerhalb des Bereiches der vorliegenden Erfindung.

Das Verbinden/Trennen eines Stromversorgungsbusses ist auch in Betracht gezogen. Das Hinzufügen eines Leistungsschalters/ von Leistungsschaltern, die zwischen Vdd und jeder Funktionseinheit verbunden sind, kann verwendet werden, die Stromzuführung zu den Funktionseinheiten ein- und auszuschalten, indem der Leistungsschalter (z.B., ein FET (Feldeffekttransistor)) unter Verwendung des obigen CKPWRON Steuersignals oder Ähnlichem gesteuert wird. In diesem Fall der Stromabschaltung wird ein gewisser Gleichstrom durch den Leistungsschalter verbraucht, wobei sich aber mit den unterbrochenen Funktionseinheit(en) eine Gesamteinsparung ergibt.

Das Nettoergebnis dieser vier Schritte der vorliegenden Erfindung ist eine beträchtliche Verringerung der von der mikroelektronischen Einrichtung 100 verbrauchten Energie. Diese Verringerung ergibt sich aufgrund der Tatsache, daß die Funktionseinheiten nicht eingeschaltet bleiben, wenn sie nicht benötigt werden. Wie im einzelnen unten erläutert ist, wird, da eine CMOS Technologie verwendet wird, Strom nur verbraucht, wenn eine Funktionseinheit ihren Zustand ändert (d.h., schaltet). Da eine Funktionseinheit "aus" ist, wenn sie an einer Zustandsänderung gehindert wird, wird ein vernachlässigbarer Strom von dieser Funktionseinheit verbraucht. Dies bedeutet, daß eine Funktionseinheit, die ausgeschaltet ist, keine Energie verbraucht, was die Verringerung des Energieverbrauchs ergibt.

Da der Energieverbrauch verringert wird, werden die Wärmeableitungsanforderungen des Chips 102 und die damit verbundene Unterbringung der mikroelektronischen Einrichtung 100 als Baugruppe (nicht gezeigt) verringert. Des weiteren kann, wenn eine Batteriequelle verwendet wird, diese für eine gegebene Betriebszeitdauer kleiner gemacht werden. Des weiteren kann die Leitungsweite der Stromzuführungsbusse ebenfalls verringert werden, weil der Stromverbrauch verringert ist.

Ein repräsentatives Beispiel der Arbeitsweise der vorliegenden Erfindung gemäß dem Ablaufdiagramm der Fig. 2 ist nun unter Bezugnahme auf Fig. 3 beschrieben. Fig. 3 zeigt vier Spuren, von denen jede denselben Zeitrahmen auf der horizontalen Achse aufweist. Die vertikale Achse jeder Spur gibt die Amplitude eines Signals oder den Zustand einer Funktionseinheit oder den Arbeitszustand gemäß der vorliegenden Erfindung an, wie es unten beschrieben ist. Die obere Spur 301 zeigt die Wellenform 302, die der Ausgang des Systemtaktgebers 104 (Fig. 1) ist, d.h., der Takt für alle Funktionseinheiten, die die mikroelektronische Einrichtung 100 bilden. Die zwei Systemtakte sind um 180° phasenverschoben.

Die repräsentative Funktionseinheit der Fig. 3, die für diese Erläuterung gewählt ist, ist eine Gleitkommaeinheit (FPU) 110. Wie es in dem Beispiel des Abschnitt unten erörtert ist, zeigt es sich, daß die FPU 110 in vielen Computersystemen ungefähr 10% der Zeit benutzt wird. Infolgedessen erzeugt die vorliegende Erfindung eine beträchtliche Verringerung der Energieableitungsanforderungen und des Stromverbrauchs, soweit er sich auf die FPU 110 bezieht, wie es offensichtliche wird.

Die dritte Spur 305 zeigt die Ausführung zweiter Gleitkomma-Operationen. Die erste Gleitkomma-Operation, die mit A bezeichnet ist, ist durch einen Kasten 306 angegeben. Der Kasten 306 gibt die Anzahl Taktzyklen wieder, die verlangt wird, die Gleitkomma-Operation A auszuführen. Ähnlich ist eine Gleitkomma-Operation B, wie sie durch einen Kasten 318 angegeben ist, auch dargestellt und zeigt die Anzahl Taktzyklen, die verlangt wird, sie auszuführen. Insbesondere werden 5 Taktzyklen benötigt, um die Gleitkomma-Operation A auszuführen, und zwei Taktzyklen werden benötigt, die Gleitkomma-Operation B auszuführen. Es versteht sich, daß diese Zeitrahmen nur zum Zweck der Darstellung sind. Tatsächlich kann es bei der wirklichen Praxis sein, daß die Gleitkomma-Operation eine Anzahl Zyklen benötigt, die auszuführen sind. Des weiteren

kann es Tausende von Zyklen zwischen jeder Gleitkomma-Operation geben. Jedoch ist Fig. 3 nicht groß genug, dies graphisch darzustellen. Somit sind der Abstand zwischen den Gleitkomma-Operationen A und B und die Länge einer jeden zum Zweck der Darstellung beliebig klein gemacht worden.

Die vierte Spur 307 der Fig. 3 stellt die vier Schritte dar, die in bezug auf jede der Gleitkomma-Operationen A und B stattfinden. In bezug auf die Gleitkomma-Operation A ist die CCA Periode dargestellt, daß sie drei halbe Zyklen verlangt. Diese CCA Periode ist durch das Bezugszeichen 308 angegeben. Eine CKPWRUP Periode für die Gleitkomma-Operation A ist ein einziger, halber Taktzyklus und ist durch einen Zeitblock 310 angegeben. Die Zeitdauer, die die Gleitkomma-Operation A benötigt, entspricht der CKPWRON Periode, die durch einen Zeitblock 312 dargestellt ist. Schließlich ist eine CKPWRDN Periode ein halber Taktzyklus und ist durch einen Zeitblock 314 dargestellt.

Die tatsächliche Arbeitsweise der FPU 110, die Gleitkomma-Operation A auszuführen, wird gemäß der vorliegenden Erfindung gesteuert, indem der Systemtakt 302 dem Takteingang der FPU 110 während der Zeitdauer der Taktzyklen geliefert wird, die durch das Bezugszeichen 304 der Spur 303 angegeben sind. Man sieht in der Spur 303, daß der Systemtakt, der dem Takteingang der FPU geliefert wird, einen halben Taktzyklus vor dem Beginn der Ausführung der Gleitkomma-Operation A bereitgestellt wird und während eines halben Taktzyklus nach Beendigung der Gleitkomma-Operation A beibehalten wird.

Ein ähnliches Beispiel ist für die Gleitkomma-Operation B gezeigt. Erneut auf die Spur 307 bezugnehmend ist die CCA Periode durch einen Zeitblock 320 angegeben, der zum Zweck der Darstellung gezeigt ist, als daß er drei halbe Zyklen benötigt. Ein CKPWRUP Zeitblock 322 ist ein halber Taktzyklus. Ein CKPWRON Zeitblock 324 ist zwei Taktzyklen, die dem Zeitrahmen entsprechen, der von der FPU 110 verlangt wird, die Gleitoperation B zu beenden. Schließlich ist ein CKPWRDN Zeitblock 326 ein halber Taktzyklus.

Fig. 3 stellt die Energieeinsparung dar, die sich bei der Arbeitsweise gemäß der vorliegenden Erfindung ergibt. Insbesondere kann man unter Bezugnahme auf die Spur 303 sehen, daß sich der Zustand der FPU 110 nur ändern darf, wenn es ein Taktsignal gibt, das an den Takteingang der FPU angelegt ist. Mit anderen Worten ist die FPU 110 bei

dem dargestellten Beispiel nur während der Periode 304 und während der Periode 316 betreibbar und ist während der dazwischenliegenden Zeitperioden nicht betreibbar. Somit kann man sehen, wo die Energieeinsparungen gemäß der vorliegenden Erfindung auftreten.

Man sollte erkennen, daß alle Funktionseinheiten in der mikroelektronischen Einrichtung 100 ähnlich durch die vorliegende Erfindung gesteuert werden, so daß nur die Funktionseinheit(en), die benötigt wird, den letzten Maschinencodebefehl auszuführen, der ausgegeben worden ist, eingeschaltet ist. Alle anderen unbenötigten Funktionseinheiten sind ausgeschaltet. Somit ergeben sich beträchtliche Energieeinsparungen gemäß der vorliegenden Erfindung.

Die vorliegende Erfindung weist eine besondere Anwendbarkeit auf integrierte CMOS Schaltungen auf. Der Grund hierfür ist, daß CMOS Schaltungen nur Strom verbrauchen, wenn sie ihren Zustand ändern. Mit anderen Worten wird Strom nur verbraucht, wenn ein Schalten auftritt. Unter dem Gesichtspunkt des Übergangs- oder Wechselstroms ist die verbrauchte Energiemenge, einen Knoten zu schalten, proportional zu  $CV^2$ , wo C = Kapazitätswert in Farad für den geschalteten Knoten und V die Spannung von der Bahn  $V_{ss}$  zu der Bahn  $V_{DD}$  ist. Unter dem Gesichtspunkt des kontinuierlichen Zustands oder des Gleichstroms ist die Größe der verbrauchten Energie gleich 5-15% in Abhängigkeit von den Variablen des Herstellungsverfahrens und der Eingangsanstiegsgeschwindigkeit.

Ein CMOS sollte mit BiCMOS verglichen werden, wo der Stromverbrauch der bipolaren Schaltung wegen eines zu "geringen" Eingangswiderstands durch die Basis der Einrichtung und des verwendeten Stromsteuermechanismus nicht ausgeschaltet werden kann. Im Gegensatz haben CMOS (und MOS Einrichtungen im allgemeinen) eine hohe Eingangsimpedanz an der Gateelektrode wegen der elektrischen Isolereigenschaften des Gateoxids.

Ein CMOS sollte ebenfalls mit einer bipolaren Transistorschaltungsanordnung verglichen werden. Bipolare Transistoren verbrauchen elektrische Energie unabhängig davon, ob irgendein Schalten auftritt oder nicht. Mit anderen Worten fließt Strom in der Schaltung, selbst wenn kein Schalten stattfindet. Dies ist der Grund, warum die CMOS

Technologie die Technologie der Wahl bei integrierten Schaltungen geworden ist, wobei aufgrund ihres niedrigen Energieverbrauches eine Verkleinerung der Stromversorgungen (z.B. Batterien für tragbare Computer) machbar ist.

Die vorliegende Erfindung ist besonders auf einer CMOS Schaltungsanordnung anwendbar. Sie ist auch auf einem BiCMOS, NMOS, MESFET, einer  $I^2L$  und einer GaAs Schaltungsanordnung ebenfalls anwendbar.

Die vorliegende Erfindung zieht jegliche geeignete Methode in Betracht, um zu steuern, ob sich der Zustand einer Funktionseinheit ändern darf. Diese Steuerung von Zustandsänderungen schaltet die Funktionseinheit ein und aus und erzeugt die erwünschte Energieverringerung gemäß der vorliegenden Erfindung.

Es wird nun auf Fig. 4 Bezug genommen, in der eine repräsentative Methode zur Steuerung des Zustands einer Funktionseinheit gemäß der vorliegenden Erfindung gezeigt ist. Diese Methode steuert die Bereitstellung des Systemtaktsignals 302 für die betreffende Funktionseinheit. Die Funktionseinheit verbraucht nur Energie, wenn die vorliegende Erfindung das Systemtaktsignal 302 bereitstellt. Es wird nun auf Fig. 4 Bezug genommen, wobei die logische Einheit 116 der vorliegenden Erfindung die Ausgabe von Maschinencodebefehlen über einen Weg 402 gemäß irgendeiner geeigneten Methode bestimmt (z.B. durch Decodierung), die unten erörtert ist. Die durch den Weg 402 bereitgestellte Intelligenz erlaubt der Logikeinheit 116, zu wissen, wann verschiedene Funktionseinheiten gemäß der vorliegenden Erfindung ein- bzw. und auszuschalten sind.

Der Systemtaktgenerator 104 liefert das Systemtaktsignal 302 an die Logikeinheit 116. Zum Zweck der Darstellung sind vier Funktionseinheiten gezeigt, die mit #1, #2, #3 und #4 bezeichnet sind. Das Bezugszeichen 406 entspricht der Funktionseinheit 1, das Bezugszeichen 410 entspricht der Funktionseinheit 2, das Bezugszeichen 414 entspricht der Funktionseinheit 3 und das Bezugszeichen 418 entspricht der Funktionseinheit 4. Jede Funktionseinheit 406, 410, 414 und 418 besitzt eine entsprechende Takteingangsleitung 404, 408, 412 bzw. 416.

Beim Betrieb liefert die Logikeinheit 116 ein Systemtaktsignal 302 an die geeignete Takteingangsleitung für die Funktionseinheit, die eingeschaltet wird. Wenn diese

Funktionseinheit ausgeschaltet werden soll, liefert die Logikeinheit 116 nicht länger den Systemtakt 302. Da die Funktionseinheit ohne Bereitstellung des Taktsignals den Zustand nicht ändern kann, wird durch die Funktionseinheiten, die kein Taktsignal 302 erhalten, keine Energie verbraucht. Auf diese Weise wird eine Funktionseinheit ein- oder ausgeschaltet, indem das Taktsignal 302 ein- oder ausgeschaltet wird.

Eine alternative Methode, die Funktionseinheiten ein- und auszuschalten, ist in Fig. 5 gezeigt. Es wird nun auf Fig. 5 Bezug genommen, wobei die Funktionseinheiten 406, 410, 414 bzw. 418 ein- und ausgeschaltet werden, indem die Zustandsänderung der Eingänge zu diesen Funktionseinheiten gesteuert wird. Indem nicht gestattet wird, daß die Eingänge der Funktioneingänge die aus sind, den Zustand ändern, schaltet dieses Methode wirksam solche Funktionseinheiten aus. Nur die Eingänge von Funktionseinheiten, die ein sind, dürfen den Zustand ändern.

Fig. 5 zeigt eine Möglichkeit, diese Strategie auszuführen. Eine Technik, die Eingänge vom Schalten abzuhalten, ist den vorhergehenden Eingang (bei 502 gezeigt) zwischenzuspeichern und zu halten, wobei eine bekannte gesteuerte Zwischenspeichereinrichtung verwendet wird (siehe z.B. die Zwischenspeicher 504, 510, 516 und 522). Die Zwischenspeicher 504, 510, 516 und 522 werden gesteuert, die zwischengespeicherten Eingänge über Steuerleitungen 508, 514, 520 und 526 hindurchzulassen, die von der Logikeinheit 116 auf der Grundlage des Signals 402 erzeugt werden können, wie es für den Durchschnittsfachmann auf dem Gebiet offensichtlich ist. Alternativ können die Eingänge auf einen hohen Impedanzwert gezwungen werden, indem der Eingang mit einem Steuersignal einer logischen UND-Verknüpfung unterzogen wird. Viele andere funktional äquivalente Techniken werden für den Durchschnittsfachmann auf dem Gebiet ohne weiteres offensichtlich.

Eine ähnliche Struktur und Arbeitsweise wird auf die Funktionseinheit 410, die Funktionseinheit 414 und die Funktionseinheit 418 angewendet. Deshalb wird eine getrennte Erörterung von ihnen nicht benötigt.

Die vorliegende Erfindung verwendet die folgende Methode, um die Überwachungsinformationen auf der Leitung 402 zu erhalten, die von der Logikeinheit 116 verwendet

wird, um zu bestimmen, wann jede Funktionseinheit während der Ausführung der Maschinencodebefehle ein- und ausgeschaltet werden soll.

Wie es in Fig. 6 gezeigt ist, wird ein Computerprogramm in Quellencodeform, das mit einem Bezugszeichen 602 bezeichnet ist, einem Compilierer 604 zugeführt, um den Quellencode 602 in Maschinencode zu compilieren. Der Compilierer 604 erzeugt Maschinencodebefehle nach dem Compilieren des Quellencodes. Zum Zweck der Darstellung sind sechs Maschinencodebefehle 606, 610, 614, 618, 622 und 626 gezeigt. Jeder Maschinencodebefehl hat einen entsprechenden Funktionseinheitsdatenblock, der die Überwachungsinformation enthält, die über den Weg 402 der Logikeinheit 116 zugeführt wird. Die Funktionseinheitsdaten (FUD), die einen gegebenen Maschinencodebefehl begleiten, könnten somit der Logikeinheit 116 erlauben, die mikroelektronische Einrichtung 100 gemäß der vorliegenden Erfindung zu betreiben.

Eine alternative Möglichkeit, Überwachungsinformationen auf der Leitung 402 zu liefern, ist in Fig. 7 gezeigt. Hier liefert der tatsächliche Betrieb eines Superskalarmikroprozessors eines Computers (RISC) mit verringertem Befehlssatz, was eine typische Anwendung der vorliegenden Erfindung ist, die Überwachungsinformation auf der Leitung 402 wie folgt. Das Quellencodecomputerprogramm 602 wird einem Compilierer 702 zugeführt, der Maschinencodebefehle 704 erzeugt. Die Maschinencodebefehle werden zuerst einer Befehlsdecodiereinheit (IDU) 706 zugeführt. Die decodierten Befehle von IDU 706 werden einer Befehlsausführungseinheit (IEU) 708 zugeführt.

Die IDU 706 und die IEU 708 liefern, indem sie eine umgeordnete Ausführung durchführen, die decodierten Informationen 402, wie es angegeben ist. Diese decodierte Information kann die Form einer Datenabhängigkeitsinformation, einer Befehlsausgabeinformation oder Ähnlichem annehmen. Die Information ist von der Befehlsablaufsteuerungslogik verfügbar. Ein Beispiel einer Befehlsablaufsteuerlogik ist in der mitanhängigen Anmeldung mit dem Titel "Superscalar RISC Instruction Scheduling" US-A-5 497 499 auffindbar, die gemeinsames Eigentum ist.

Fig. 8 zeigt eine Ausführungsform der vorliegenden Erfindung, wobei ein Optimierungsc compilierer 802 verwendet wird, die Maschinencodebefehle in einer Weise zu ordnen, die die Energieeinsparung maximiert, die durch die vorliegende Erfindung erzeugt wird.

Diese Energieeinsparung wird erreicht, indem die Maschinencodebefehle aus der Reihenfolge umgeordnet werden, wie sie von dem Quellencode abgeleitet wird. Die Umordnung wird gemacht, um die Verringerung des Energieverbrauchs durch die mikroelektronische Einrichtung 100 in Verbindung mit dem laufenden Computerprogramm 602 zu optimieren.

Ein repräsentatives Blockdiagramm, das eine solche Optimierung zeigt, ist in Fig. 8. Wie es gezeigt ist, erzeugt der Optimierungscompiler 802 einen Ausgang in der Form umgeordneter Maschinencodebefehle. Zum Zweck der Darstellung werden die gleichen Maschinencodebefehle mit den begleitenden Daten der Funktionseinheit, die in Fig. 6 angetroffen werden, verwendet, um das Umordnungskonzept zu zeigen. Man sieht, daß die Maschinencodebefehle mit ihren zugeordneten FUD umgeordnet sind. Dieses Beispiel dient dazu, darzustellen, daß die Umordnung eine Optimierung in Größen einer Energieverbrauchsverringerung erzeugen kann.

Die umgeordneten Maschinencodebefehle werden dann an die Funktionseinheiten ausgegeben, die durch die Logikeinheit 116 gemäß der in Verbindung mit Fig. 6 beschriebenen Arbeitsweise gesteuert werden. Wenn der Compiler 802 bestimmt, daß ein oder mehrere Funktionsblöcke nach dem Befehl 1 für irgendeine Anzahl Zyklen nicht verwendet werden, kann sie Sperr- oder Stromabschaltsignale an diesen einen oder an mehrere Funktionsblöcke schicken, um das Taktieren anzuhalten, Eingänge zu sperren oder die Stromversorgung auszuschalten, wie es auch sein mag, bis der eine oder mehrere Blöcke in der Zukunft benötigt werden.

Um die Energieeinsparung aufzuzeigen, die von der vorliegenden Erfindung erwartet werden kann, ist unten ein Beispiel einer mikroelektronischen Einrichtung 100 beschrieben. Man beachte, daß dies nur beispielhaft ist. Jedoch stellt es weiter dar, wie die vorliegenden Erfindung die beträchtliche Energieverringerung erreicht, die auftritt.

Um einen repräsentativen Wertebereich für eine Energieverringerung zu zeigen, die durch die vorliegende Erfindung erreicht werden kann, wurde die mikroelektronische Einrichtung 100 verwendet, die die in dem Grundriß der Fig. 9 gezeigten Funktionseinheiten aufweist. Bei diesem Beispiel zeigt Tabelle 1 für einen 5W Chip den repräsentativen

ven Prozentsatz der Benutzung und der Energieeinsparung. Man beachte, daß die gesamte Stromabschalteinsparung 46% (2,3/5) darstellt.

| Funktionseinheit | Nennleistung | Benutzungs-Prozente | Energieabschaltein-sparung |
|------------------|--------------|---------------------|----------------------------|
| Gleitkomma       | 1,5          | 10                  | 1,35                       |
| ganzzahlig       | 1,0          | 90                  | 0,10                       |
| Speicher         | 2,0          | 75                  | 0,50                       |
| Graphik          | 0,5          | 30                  | 0,35                       |
| Gesamteinsparung |              |                     | 2,30W                      |

Tabelle 1

Die "selektiven Abschalt"-Techniken der vorliegenden Erfindung können ohne weiteres bei stark strukturierten, funktionalen Einheiten/Modulen angewendet werden, die in einer mitanhängigen Anmeldung mit dem Titel "Hardware Emulation Accelerator and Method" WO 93/16433, die Gemeinschaftseigentum ist, geoffenbart sind.

### **Optimierungsstrategie bei Laptop-, Notbook- und Palmtop-Computern**

Wie es oben erörtert worden ist, erzeugt die vorliegende Erfindung beträchtliche Einsparungen bei dem Energieverbrauch. Dies hat eine sehr direkte Wirkung auf Laptop- und Palmtop-Computer, wo das Gewicht sehr kritisch ist, wenn es nicht der kritischste Faktor im Hinblick auf die Benutzerakzeptanz ist. Selbst eine Verringerung von 0,25 kg kann für einen Benutzer ausreichend sein, diesen bestimmten Computer gegenüber einer schwereren Version auszuwählen. Obgleich merkliche Schritte im Hinblick auf die Batterietechnologie gemacht worden sind, die eine beträchtliche Gewichtsverringerung ergeben, wäre irgendeine Verringerung des Energieverbrauchs äußerst bedeutend, da sie eine viel längere Betriebsdauer für eine gegebene Batterie und Batterieladung erzeugen würde.

Fig. 10 zeigt ein Blockdiagramm einer Strategie, die gemäß der vorliegenden Erfindung verwendet werden kann. Wie es gezeigt ist, kann der Benutzer eine längere Batteriedaueroption auswählen, wenn der Laptop- und der Palmtop-Computer betrieben wer-

07.07.98

21

den. Dies ist durch 1002 angegeben. Sobald diese Option ausgewählt ist, verwendet die vorliegende Erfindung ein Optimierungsschema, wie es durch das Bezugszeichen 1004 angegeben ist und das wirkt, den Energieverbrauch der mikroelektronischen Einrichtung zu verringern. Dies könnte viele unterschiedliche Formen annehmen, wie eine Umordnung der Maschinencodebefehle oder einen Betrieb bestimmter Funktionseinheiten getrennt und unabhängig voneinander.

Diese Methode besitzt eine besondere Anwendbarkeit bei Situationen, wo der Laptop- oder Palmtop-Computer während einer ausgedehnten Zeitdauer von einer üblichen Spannungsquelle entfernt verwendet wird. Mit anderen Worten, die Einheit läuft ausschließlich mit der Batterie. Der Benutzer wünscht, die Betriebszeit des Laptop- oder Palmtop-Computers in einer solchen Situation zu maximieren. Diese Optimierungsme- thode gestattet, daß dies erreicht wird.

07.07.98

EP 93 906 871.4

SEIKO EPSON CORPORATION

**Patentansprüche**

1. Ein System für eine mikroelektronische Einrichtung zur Verringerung des Energieverbrauchs und der Wärmeableitungsanforderungen, wobei das genannte System umfaßt:
  - (a) eine Takteinrichtung (104) zur Erzeugung eines Systemtaktsignals;
  - (b) eine Compilierereinrichtung (604, 7092, 802) zur Compilierung von Quellencode in Maschinencodebefehle (602);
  - (c) eine erste Funktionseinheit (406, 410, 414, 418) zur Ausführung einer ersten Gruppe der genannten Maschinencodebefehle;
  - (d) eine zweite Funktionseinheit (406, 410, 414, 418) zur Ausführung einer zweiten Gruppe der genannten Maschinencodebefehle; und
  - (e) eine Logikeinrichtung (116), damit das genannte Systemtaktsignal (302) der genannten ersten Funktionseinheit nur während einer Periode zugeführt wird, die damit zusammenfällt, wenn die genannte erste Funktionseinheit die genannte erste Gruppe der genannten Maschinencodebefehle ausführt, und damit das genannte Systemtaktsignal (302) der genannten zweiten Funktionseinheit nur während einer zweiten Periode zugeführt wird, die damit zusammenfällt, wenn die genannte zweite Funktionseinheit die genannte zweite Gruppe der genannten Maschinencodebefehle ausführt,

dadurch gekennzeichnet, daß

die genannte Compiliereinrichtung (604, 702, 802) die genannten Maschinencodebefehle (602) umordnet, um die Energieverbrauchsverringerung zu optimieren, und daß jeder Maschinencodebefehl einen zugeordneten Datenblock (608, 612 ... 628) aufweist, der angibt, ob die genannte erste Funktionseinheit oder die genannte zweite Funktionseinheit benötigt wird, den Maschinencodebefehl auszuführen, und daß die genannte Logikeinrichtung (116) konfiguriert ist, den genannten Datenblock eine vorbestimmte Anzahl von Systemtaktzyklen vor der Ausführung der Maschinencodeinstruktion auszuwerten, um zu bestimmen, welche der genannten Funktionseinheiten (112, 114) den Befehl ausführen wird.

2. Das System des Anspruchs 1, das des weiteren wenigstens einen Leistungsschalter umfaßt, der mit der genannten Logikeinrichtung (116) und der genannten ersten und zweiten Funktionseinheit (402, 420, 414, 418) gekoppelt ist, um die Funktionseinheiten mit einer Stromversorgung zu verbinden.
3. Das System wenigstens eines der Ansprüche 1 bis 2, das des weiteren eine Befehldecodeereinheit (706) umfaßt, um Befehle zu decodieren und decodierte Informationen der genannten Logikeinrichtung (116) zuzuführen.
4. Das System wenigstens eines der Ansprüche 1 bis 3, das des weiteren eine Zwischenspeichereinrichtung (504, 510, 516, 522) umfaßt, um die Taktsignale von der Logikeinheit (116) zwischenspeichern, die den Funktionseinheiten (406, 410, 414, 418) zugeführt werden.
5. Ein Verfahren zur Verringerung des Energieverbrauchs einer mikroelektronischen Einrichtung, die eine Mehrzahl Funktionseinheiten (406, 410, 414, 418) aufweist, indem gestattet wird, daß ein Strom zu jeder Funktionseinheit der mikroelektronischen Einrichtung nur fließt, wenn die Funktionseinheit notwendig ist, eine Operation in Verbindung mit der Ausführung eines Maschinencodebefehls (704) aus einem Strom von Maschinencodebefehlen auszuführen, wobei das Verfahren die Schritte umfaßt:
  - (1) Auswerten eines Stroms von Maschinencodebefehlen, um bei einem Maschinencodebefehl auf Maschinenbefehlsgrundlage zu bestimmen, welche Funktionseinheit

heit notwendig sein wird, um eine Operation durchzuführen, um jeden Maschinenbefehl auszuführen;

(2) Umordnen der genannten Maschinencodebefehle, um dadurch die Energieverbrauchsverringerung zu optimieren;

(3) Zuführen elektrischer Energie zu den genannten notwendigen Funktionseinheiten, um die Operation(en) auszuführen, zu einer vorbestimmten Zykluszeitgröße vor der Ausführung;

(4) Fortfahren, elektrische Energie gemäß Schritt (3) nur solange zuzuführen, wie es die Ausführung des genannten Maschinencodebefehls verlangt; und

(5) Wiederholen der Schritte (1) bis (4) für jeden Maschinencodebefehl, wodurch die Energieableitung und der Energieverbrauch durch die mikroelektronische Einrichtung verringert werden.

6. Das Verfahren des Anspruchs 5, wobei der Schritt, elektrische Energie den Schritten (3) und (4) zuzuführen, einen Schritt umfaßt, eine Stromversorgungsspannung an die Funktionseinheit(en) (406, 410, 414, 418) zu liefern.
7. Das Verfahren des Anspruchs 5, wobei der Schritt, Energie den Schritten (3) und (4) zuzuführen, einen Schritt umfaßt, eine Systemtaktsignal der Funktionseinheit(en) (406, 410, 414, 418) zu liefern.

07.07.90

93 906 871.4

1/7



**FIG.\_1**

07.07.98

93 906 871.4

2/7



**FIG.\_2**

93 906 871.4

3/7

07.07.98



FIG. - 3

07.07.98

93 906 871.4

4/7



FIG.\_4



FIG.\_5

07.07.93

93 906 871.4

5/7



FIG.\_6



FIG.\_7

07.07.98

93 906 871.4

6/7



07.07.92

93 906 871.4

7/7



**FIG. 9**

**This Page is Inserted by IFW Indexing and Scanning  
Operations and is not part of the Official Record**

## **BEST AVAILABLE IMAGES**

Defective images within this document are accurate representations of the original documents submitted by the applicant.

Defects in the images include but are not limited to the items checked:

- BLACK BORDERS**
- IMAGE CUT OFF AT TOP, BOTTOM OR SIDES**
- FADED TEXT OR DRAWING**
- BLURRED OR ILLEGIBLE TEXT OR DRAWING**
- SKEWED/SLANTED IMAGES**
- COLOR OR BLACK AND WHITE PHOTOGRAPHS**
- GRAY SCALE DOCUMENTS**
- LINES OR MARKS ON ORIGINAL DOCUMENT**
- REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY**
- OTHER:** \_\_\_\_\_

**IMAGES ARE BEST AVAILABLE COPY.**

**As rescanning these documents will not correct the image problems checked, please do not report these problems to the IFW Image Problem Mailbox.**

*This Page Blank (uspto)*